\chapter*{Introduction}
\addcontentsline{toc}{chapter}{Introduction}

\paragraph{}
Le data mining, ou fouille de données en français, correspond à l'extraction de connaissances à partir de données. 
Il permet : 
\begin{itemize}
\item de caractériser ou discriminer, 
\item d'associer, 
\item classer ou prédire, 
\item d'analyser des groupes, des exceptions, des tendances ou des évolutions. 
\end{itemize}


\paragraph{}
L'objectif de ce projet est de trouver les protéines les plus semblables en utilisant la méthode de data mining. 
La fonction d'une protéine découlant de sa structure géométrique, ces deux critères sont compris dans le terme "semblables". 

\paragraph{}
Dans notre cas, les données seront donc des informations sur les protéines et nous chercherons à analyser des groupes.
Ces groupes seront donc des familles de protéines, à l'intérieur desquelles nous tenterons de maximiser les ressemblances, alors que nous minimiserons ces dernières entre les différentes familles. 
